Model Selection

Multimodal embedding

# Multimodal embedding

A vision-language model fine-tuned based on SigLIP 2, with maximum text length increased from 64 to 256 tokens

Transformers English

Taxabind Vit B 16

TaxaBind is a multimodal embedding space model incorporating six modalities, focusing on ecological applications, supporting zero-shot classification of species images using taxonomic text categories.

Multimodal Fusion

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase